home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group98c.txt / 000008_icon-group-sender _Thu Sep 10 16:54:52 1998.msg < prev    next >
Internet Message Format  |  2000-09-20  |  3KB

  1. Return-Path: <icon-group-sender>
  2. Received: from kingfisher.CS.Arizona.EDU (kingfisher.CS.Arizona.EDU [192.12.69.239])
  3.     by baskerville.CS.Arizona.EDU (8.9.1a/8.9.1) with SMTP id QAA04917
  4.     for <icon-group-addresses@baskerville.CS.Arizona.EDU>; Thu, 10 Sep 1998 16:54:52 -0700 (MST)
  5. Received: by kingfisher.CS.Arizona.EDU (5.65v4.0/1.1.8.2/08Nov94-0446PM)
  6.     id AA31445; Thu, 10 Sep 1998 16:54:25 -0700
  7. To: icon-group@optima.CS.Arizona.EDU
  8. Date: 10 Sep 1998 20:00:24 GMT
  9. From: jeffery@cs.utsa.edu (Clinton Jeffery)
  10. Message-Id: <6t9b4o$8rs$1@ringer.cs.utsa.edu>
  11. Organization: The University of Texas at San Antonio
  12. Sender: icon-group-request@optima.CS.Arizona.EDU
  13. References: <35F723CF.76B3CC97@Japan.NCR.COM>
  14. Reply-To: jeffery@cs.utsa.edu
  15. Subject: Re: Unicode support or support for non-Ascii based character manipulation?
  16. Errors-To: icon-group-errors@optima.CS.Arizona.EDU
  17. Status: RO
  18.  
  19. Eric Hildum (Eric.Hildum@Japan.NCR.COM) wrote (and I paraphrase/edited):
  20. : Icon ... supporting only ASCII makes it less useful for non-English language
  21. : With Unicode... it should be possible to begin including support for
  22. : non-English and non alphabetic languages.
  23.  
  24. : Has anyone thought about this yet? What does string and pattern matching
  25. : mean in, for example, Japanese?
  26.  
  27. 1. Other folks have been thinking about it, especially Icon users in Asia.
  28. For example, a Chinese version of Icon has been done by researchers in China.
  29.  
  30. 2. Going to Unicode might not be *that* difficult, but I think Unicode isn't
  31. really as widely adopted as you might suggest.  Many people seem to be using
  32. mixed 8/16-bit strings.
  33.  
  34. 3. The semantics of string and pattern matching are no different in Japanese
  35. than in English.  There is nothing specific to language or grammar in the Icon
  36. string and pattern matching repertoire.  Of course, when the character set
  37. changes the actual code needs to change...
  38.  
  39. 4. Let's look at the current situation for mixed-character sets.  I am not
  40.    sure how Chinese Icon stands on these, but consider plain-old Windows Icon.
  41.    Divide functionality as follows:
  42.     non-alphabetic output: Windows Icon already can do this
  43.     non-alphabetic input: we have known bugs in the input processing
  44.         of these, either in Windows Icon or the IPL "vidgets" code.
  45.     non-alphabetic string scanning: not supported, but could be
  46.         implemented as Icon Program Library procedures.  Even
  47.         Unicode string semantics could be implemented as library
  48.         procedures on top of (even length!) Icon strings.
  49.  
  50. We don't really need much additional infrastructure.  Some folks in the user
  51. community could coordinate the library procedures to do this as an
  52. interesting project.  We do also need someone who can compile Icon from its
  53. C code and debug I/O problems on a non-alphabetic platform at this point.
  54.  
  55. --
  56. Clint Jeffery, jeffery@cs.utsa.edu
  57. Division of Computer Science, The University of Texas at San Antonio
  58. Research http://www.cs.utsa.edu/research/plss.html
  59.